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摘 要 人 类 能 够 快速 提取 集合 中 的 统计 信息 , 形成 平均 表征 。 对 于 平均 表征 的 产生 机 制 , 研究 者 提出 整合 集合 成 
员 以 合成 平均 刺激 , 或 计算 集合 成 员 特征 值 的 平均 值 两 种 观点 。 以 往 研 究 中 合成 的 平均 刺激 的 特征 值 和 计算 成 员 


特征 值 的 平均 值 两 种 方式 的 结果 相似 , 难以 区 分 两 种 观点 。 由 于 多 个 面孔 的 吸引 力 评 分 的 均值 与 用 这 些 面孔 合成 


F 均 面孔 的 吸引 力 评分 存在 差异 ,本 研究 使 用 经 典 的 3 


F 均 辨别 任务 (实验 1 和 2) 和 吸引 力 评价 任务 (实验 3 和 4) 


集合 探讨 平均 表征 的 形成 机 制 , 结果 发 现 大 、 小 集合 都 


的 产生 机 制 提 供 了 新 证 据 。 
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1 引言 


我 们 的 视觉 系统 每 时 每 刻 接收 到 海量 信息 ， 这 
些 信 息 很 多 是 高 度 结构 化 的 。 这 些 结构 化 的 信息 彼 
此 相似 ， 以 集合 的 形式 存在 。 人 们 可 以 对 这 些 集合 
进行 知觉 平均 (perceptual averaging)， 相 当 精 确 地 
抽取 集合 内 所 有 成 员 的 平均 表征 (average 
representation, Alvarez, 2011; Haberman & Whitney, 
2012; Whitney & Leib, 2018), 涉及 大 小 、 方 向 、 明 
度 、 位 置 等 低 水 平 特征 (Alvarez & Oliva, 2008; 
Ariely, 2001; Bauer, 2009; Parkes et al., 2001)， 也 包 
括 面孔 身份 、 性 别 和 表情 等 高 级 社会 性 信息 
(Haberman & Whitney, 2007; Haberman et al., 2015; 
Li et al., 2016)。 很 多 人 研究 关注 大 脑 中 平均 表征 是 如 
何 产 生 的 : 是 通过 整合 集合 成 员 来 形成 一 个 平均 刺 
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为 平均 表征 的 产生 来 源 于 合成 平均 刺激 的 观点 提供 了 支持 证 据 。4 个 实验 分 别 采用 大 容量 面孔 集合 和 小 容量 面孔 
集 形成 了 平均 刺激 ,并 且 平 均 表征 的 评定 和 加 工 可 能 更 多 依赖 
合成 的 平均 刺激 ， 而 非 简单 的 对 成 员 特 征 值 进行 平均 ;此 外 , 集合 吸引 力 出 现 了 高 评 现 象 , 但 小 集合 高 评 现象 更 少 
出 现 , 说 明 平 均 刺 激 的 作用 受到 集合 大 小 的 影响 。 本 研究 为 集合 平均 表征 的 形成 机 制 和 面孔 集合 吸引 力 高 评 现象 


激 的 表征 还 是 通过 个 体 成 员 特 征 的 平均 值 (mean 
value) 计 算 来 完成 平均 任务 (Maule & Franklin, 2015; 
Whitney & Leib, 2018)。 以 往 人 研究 中 , 平均 表征 通常 
是 用 集合 成 员 的 平均 值 来 作为 测量 指标 , 隐 含 了 平 
均 表 征 等 同 于 集合 成 员 平 均值 的 假设 。 然 而 ,由 于 
集合 平均 刺激 的 特征 值 和 成 员 特 征 值 的 平均 往往 
十 分 相似 而 难以 区 分 , 这 种 假设 并 不 能 作为 证 据 来 
区 分 平均 表征 的 产生 是 由 于 大 脑 中 形成 平均 刺激 
的 表征 还 是 由 于 集合 成 员 的 平均 值 计算 。 因 此 , OF 
均 表 征 的 形成 机 制 仍然 是 一 个 有 待 解决 的 问题 。 解 
决 这 个 问题 的 一 个 思路 就 是 分 离 集合 平均 刺激 的 
特征 值 和 集合 各 成 员 特 征 值 的 平均 ， 而 平均 面孔 由 
于 其 吸引 力 通 常 都 比 合成 平均 面孔 的 成 员 吸 引力 
平均 值 更 高 (Carragher et al., 2018; Komori et al., 
2009)， 很 适合 作为 这 个 问题 解决 的 切 人 点 。 为 了 有 
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效 区 分 平均 刺激 的 表征 和 平均 值 计 算 的 混 消 问题 ， 
本 人 研究 通过 利用 集合 面孔 吸引 力 的 平均 表征 和 集 
合 中 所 有 面孔 的 吸引 力 平均 值 的 差异 性 来 考察 知 
觉 平 均 过 程 中 是 否 形成 了 平均 刺激 的 表征 。 
1.1 平均 表征 形成 机 制 的 争议 

已 往 研究 对 平均 表征 的 形成 方式 提出 了 两 种 
主要 解释 ， 即 基于 分 布 式 注意 的 整体 编码 和 基于 聚 
焦 注 意 的 个 体 编码 。 整 体 编码 观点 认为 ,视觉 系统 
对 集合 刺激 进行 平行 加 工 ， 因 而 被 试 能 够 准确 表征 
集合 平均 值 ， 却 不 能 够 对 集合 内 的 个 体 进行 准确 表 
征 (Ariely,，2001)。 个 体 编码 观点 则 认为 ,视觉 系统 
将 有 限 的 注意 资源 集中 在 从 集合 中 抽取 的 少数 样 
本 上 , 并 对 其 进行 精细 加 工 ， 然 后 通过 样本 信息 的 
平均 值 计 算 来 推断 集合 的 平均 表征 (de Fockert & 
Marchant, 2008; Myczek & Simons, 2008)。 


究 发 现 ， 由 3 个 不 同 吸引 力 水 平 的 年 轻 男 性 面孔 组 
成 的 集合 的 吸引 力 刚 好 等 于 3 个 男性 的 平均 吸引 力 
(Anderson, 1965; Anderson et al., 1973)。 

然而 , 研究 者 也 发 现 了 不 同 的 结果 。van Osch 
等 人 (2015) 系 统 地 操纵 了 集合 的 容量 大 小 ,发 现 
当 集 合 中 的 面孔 数量 超过 6 张 , 集合 的 吸引 力 评分 
要 显著 高 于 集合 成 员 的 评分 的 平均 值 。 这 被 称 为 集 
合 吸 引力 高 评 现象 (group attractiveness effect)。 小 
容量 面孔 集合 在 特定 条 件 下 也 存在 集合 吸引 力 高 
评 现象 : 例如 Willis (1960) 发 现在 集合 只 有 2 张 或 
3 张 面孔 时 , 集合 吸引 力 的 评分 要 比 成 员 的 平均 值 更 
极端 ， 高 吸引 力 集合 的 评分 会 比 成 员 平均 评分 更 高 。 

van Osch 等 人 (2015) 认 为 集合 吸引 力 高 评 现象 
可 能 的 机 制 是 面孔 集合 的 知觉 加 工 形成 了 平均 面 
孔 的 表征 ， 即 面孔 集合 的 平均 吸引 力 表征 并 不 是 成 


从 一 般 视 觉 加 工 的 角度 看 ， 视 觉 信息 的 加 工 是 
分 层级 的 。 关 于 整体 编码 和 个 体 编码 的 争论 某 种 程 
度 上 可 以 归结 为 在 平均 表征 形成 过 程 中 整体 和 个 
体 的 视觉 加 工 层级 优先 性 。 最 近 , 视觉 加 工 的 逆 层 
级 理论 (reverse hierarchy theory, Hochstein & 
Ahissar 2002; Hochstein et al., 2015) 认 为 整体 加 工 
和 个 体 加 工 存 在 着 逆 层 级 性 ， 即 统计 表征 作为 一 种 
由 自 下 而 上 的 快速 过 程 构建 的 高 水 平 表征 优先 于 
个 体 表征 的 觉察 。 道 层级 理论 认为 ,整体 表征 (如 场 
景 主旨 gisb) 的 意识 知觉 从 高 级 皮层 开始 ,是 一 种 基 


于 低级 皮层 输入 的 知觉 过 程 ; 在 视觉 加 工 开 始 阶段 ， 


我 们 仅 能 有 意识 觉察 到 视觉 场景 的 整体 表征 (如 
gist), 不 能 觉察 到 高 水 平整 体 表征 的 前 因 细 节 
(antecedents， 即 构成 整体 表征 的 个 体 细 节 ); 在 这 
个 优先 的 层级 加 工 后 ， 视 觉 系 统 才 将 注意 导向 到 特 
定 的 低级 皮层 处 理 单元 , 提取 局 部 细节 信息 ， 即 在 


员 吸 引力 数值 的 平均 , 而 是 被 试 将 集合 中 的 所 有 面 
孔 加 以 变形 (norphb) 加 工 并 融合 成 新 的 平均 面孔 
(average-face)， 从 而 影响 集合 面孔 吸引 力 的 评价 。 
面孔 吸引 力 与 面孔 平均 性 具有 强 相 关 (O?Toole et 
al., 1999; Rhodes et al., 2001)， 即 平均 面孔 的 吸引 
力 会 由 于 平均 表征 自身 携带 的 平均 属性 而 得 到 提 
升 ， 进 而 高 于 组 成 它 的 所 有 面孔 的 吸引 力 平 均值 
(Carragher et al., 2018)。 

van Osch 等 人 (2015) 关 于 平均 面孔 的 解释 符合 
刺激 集合 形成 平均 刺激 的 表征 的 观点 , 但 并 没有 解 
释 和 集合 吸引 力 平均 值 (Anderson et al., 1973; Luo & 
Zhou, 2018) 和 集合 吸引 力 高 评 不 一 致 的 矛盾 。 我 们 
认为 这 并 不 矛盾 ，Anderson 等 (1973) 的 研究 都 采取 
了 较 小 的 面孔 集合 (N = 3 或 人 ), 而 高 评 结果 出 现 于 
较 大 的 集合 (N > 8) (van Osch et al., 2015)。 正 是 这 
种 集合 大 小 的 差异 可 能 引起 不 一 致 的 结果 : 即 相 对 


高 级 皮层 的 整体 表征 以 自 上 而 下 的 方式 返回 到 局 
部 加 工 ( 道 层级 返回 ，reverse hierarchy return) 以 证 
实 (或 矫正 ) 初 步 的 整体 表征 估计 值 (Hochstein et al., 
201$)。 因 此 ,根据 逆 层 级 理论 可 以 推论 , 平均 表征 
最 先是 大 脑 整合 粗略 的 个 体 信 息 形 成 的 , 并 非 基于 
精确 个 体 表征 的 平均 计算 ; 但 在 加 工 后 期 会 受到 个 
体 表征 的 矫正 。 然 而 ,这 仅仅 是 个 推论 有待 更 直 
接 的 证 据 证 实 。 
12 ”集合 吸引 力 高 评 现象 和 平均 面孔 吸引 力 
和 表情 、 身 份 等 其 他 面孔 特征 类 似 , 学 者 也 曾 
经 推测 面孔 集合 平均 吸引 力 应 等 于 每 张 面孔 吸引 
力 的 平均 值 (Abbas & Duchaine, 2008; Brady & 
Alvarez, 2015; Haberman & Whitney, 2012)。 早 期 研 


于 大 集合 面孔 , 集合 较 小 时 加 工资 源 足 以 对 个 体 成 
员 精 确 加 工 , 个 体 成 员 表 征 更 突显 ,更 容易 干扰 平 
均 面 孔 表 征 。Li 等 人 (2016) 的 发 现 为 这 个 观点 提供 
了 支持 证 据 : 在 有 限 的 加 工资 源 下 , 平均 表征 相对 


于 个 体 的 表征 具有 优势 性 , 个 体 表征 的 精确 度 较 低 ; 


但 如 果 加 工资 源 比 较 充 足 , 个 体 表征 精确 度 上 升 ， 
而 平均 表征 的 精确 度 则 降低 。 根 据 逆 层 级 理论 , 平 
均 表 征 的 形成 不 需要 精确 的 个 体 表征 ， 而 数值 的 计 
算 需 要 建立 在 较 高 的 个 体 表征 精确 度 之 上 。 此 外 ， 
平均 面孔 的 吸引 力也 受 集合 面孔 数量 的 影响 ， 即 小 
容量 集合 面孔 合成 的 平均 面孔 吸引 力也 低 于 大 集 
合 合成 的 平均 面孔 (Langlois & Roggman, 1990)。 事 
XE, van Osch 等 (2015) 也 发 现 ， 当 集合 容量 减少 ， 
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高 评 现象 出 现 的 概率 大 幅 下 降 。 这 可 能 是 由 于 小 容 
量 集 合 形成 的 平均 面孔 吸引 力 相 对 不 高 或 者 平均 
面孔 受到 干扰 , 也 可 能 是 没有 形成 平均 面孔 而 依赖 
于 平均 值 计算 。 因 此 ,小 容量 集合 面孔 吸引 力 的 高 
评 现象 会 减少 , 但 其 机 制 有 待 厘清 。 

1.3 ”问题 提出 和 假设 

目前 集合 平均 表征 的 形成 机 制 仍然 停留 在 理 
论 层面 ,尚未 有 直接 的 证 据 。 合 成 平均 刺激 作为 一 
种 可 能 的 机 制 , 能 够 较 好 地 解释 集合 表征 加 工 相 关 
的 理论 问题 和 实验 现象 。 首 先 ， 为 平均 表征 的 整体 
人 码 和 个 体 编码 之 争 提供 解决 思路 ;其 次 ,为 视觉 
加 工 的 逆 层 级 理论 提供 实证 支持 ; 最 后 ,为 集合 面 
孔 吸 引力 的 高 评 现 象 提供 实证 解释 。 本 研究 使 用 平 
均 辨 别 任务 (实验 1 和 2, mean discrimination paradigm, 
Haberman & Whitney，2009) 和 吸引 力 评价 任务 ( 实 
Sor 3 和 4), 通过 比较 集合 吸引 力 和 平均 面孔 的 吸引 
力 探 讨 集合 吸引 力 高 评 现 象 的 机 制 ， 以 进一步 厘清 
知觉 平均 过 程 中 是 否 形成 了 平均 刺激 的 表征 。 平均 
辨别 任务 要 求 被 试 对 单个 刺激 与 集合 平均 表征 进 
行 知觉 比较 ， 用 知觉 比较 后 对 集合 平均 表征 的 反应 
作为 因 变 量 来 推断 平均 表征 是 否 存 在 。 吸 引力 评价 
任务 要 求 被 试 对 集合 整体 和 平均 刺激 进行 评价 ， 直 
接 反映 平均 表征 的 知觉 过 程 。 我 们 设置 了 集合 中 包 
含 平 均 面 孔 的 条 件 ， 如 果 集 合 加 工 中 形成 了 平均 面 
孔 , 那么 集合 原本 有 无 平均 面孔 对 结果 将 没有 影响 ; 
如 果 没 有 形成 平均 面孔 ,那么 集合 包含 平均 面孔 将 
促进 平均 辨别 过 程 或 是 提升 集合 吸引 力 。 实 验 1 和 
3 通过 比较 在 大 容量 集合 中 包含 或 不 包含 平均 面孔 
刺激 这 两 种 条 件 下 按键 的 比例 来 为 集合 平均 面孔 
的 形成 提供 更 直接 的 证 据 ,， 实验 2 和 4 通过 比较 不 
同 集合 容量 中 集合 平均 面孔 与 集合 吸引 力 的 关系 
是 否 发 生变 化 来 为 平均 表征 的 形成 和 平均 值 计 算 
的 争议 提供 实验 数据 支持 。 此 外 , 通过 扩散 模型 分 
析 结 果 探 究 集 合 加 工 过 程 ， 为 实验 1 和 2 提供 信息 
加 工 过 程 方面 的 证 据 。 根 据 平均 表征 形成 机 制 的 不 
同 观点 ， 可 以 对 实验 的 结果 有 如 下 预测 : 

(如 果 和 平均 表征 是 通过 集合 成 员 的 吸引 力 平 
均值 计算 , 那么 由 于 平均 面孔 的 高 吸引 力 ， 包含 平 
均 面 孔 刺 激 的 集合 会 比 不 包含 平均 面孔 刺激 的 集 
合 吸 引力 更 高 ,更 接近 平均 面孔 吸引 力 ， 从 而 当 集 
合 包 含 平均 面孔 , 集合 吸引 力 会 提高 (实验 3 和 4), 
在 平均 辨别 任务 中 判断 集合 吸引 力 更 高 的 倾向 增 


加 ， 判 断 探测 刺激 平均 面孔 吸引 力 更 高 的 比例 降低 ， 


并 且 不 受 集合 大 小 的 影响 (实验 1 和 2)。 


(2) 如 果 平 均 表 征 是 通过 形成 平均 刺激 的 表征 
来 产生 , 那么 集合 中 是 否 包含 平均 面孔 刺激 对 平均 
辨别 任务 和 评分 任务 没有 影响 (实验 1 和 3), 并 且 
在 平均 面孔 受 干 扰 的 小 集合 中 , 包含 平均 面孔 刺激 
的 集合 吸引 力 更 接近 平均 面孔 吸引 力 (实验 4)， 从 
而 判断 探测 刺激 平均 面孔 吸引 力 更 高 的 比例 降低 
(实验 2)。 

(G3) 在 假设 2 的 基础 上 ， 如 果 小 集合 平均 面孔 受 
干扰 是 高 评 现象 减少 的 原因 , 那么 在 个 体 表征 较为 
突出 的 情况 下 , 集合 吸引 力 和 平均 面孔 吸引 力 的 差 
异 在 不 包含 平均 面孔 刺激 的 集合 条 件 下 更 大 (实验 
4)， 进 而 ,小 集合 判断 探测 刺激 平均 面孔 吸引 力 更 
高 的 比例 在 不 包含 平均 面孔 刺激 的 集合 条 件 下 更 
高 (实验 2)。 

(4) 如 果 小 集合 平均 面孔 吸引 力 相 对 大 集合 而 
言 较 低 是 高 评 现象 减少 的 原因 , 那么 小 集合 中 平均 
面孔 吸引 力 下 降 导 致 集合 吸引 力 和 平均 面孔 的 差 
异 更 小 (实验 3 和 实验 4 对 比 )， 进而 ,小 集合 判断 探 
测 刺激 平均 面孔 吸引 力 更 高 的 比例 更 低 (实验 1 和 
实验 2 对 比 )。 


2 实验 1: 大 容量 面孔 集合 加 工 中 

是 否 形成 平均 面孔 

实验 1 通过 平均 辨别 任务 , 要 求 被 试 选择 集合 吸 
引力 和 平均 面孔 吸引 力 之 间 较 高 的 一 个 ,操纵 集合 
中 是 否 出 现 平均 面孔 ,进而 判断 平均 面孔 是 否 形成 。 
2.1 方法 
2.1.1 被 试 

采用 GPower 以 统计 功效 power = 0.8， 中 等 效 
应 量 f= 0.25 和 重复 测量 2 ( 自 变 量 集合 类 型 : 2 个 
水 平 ) 为 参数 估计 的 最 小 样本 量 为 N = 34。 实 际 招 
募 中 国人 民 大 学 在 校生 34 名 (其 中 18 名 女性 ), F 
均 年 龄 20.75 岁 , 标准 差 2.02 岁 ， 右 利 手 , 视力 或 
矫正 视力 正常 。 本 研究 中 所 有 被 试 均 签署 知情 同意 
书 , 实验 得 到 了 中 国人 民 大 学 心理 学 系 伦理 委员 会 
的 批准 。 
2.1.2 ”实验 材料 

为 了 产生 足够 的 组 间 差 异 , 选取 了 互联 网 材料 
作为 吸引 力 极 高 和 极 低 的 面孔 图 片 , 去除 头发 、 脖 
TAHER, 将 面部 轮廓 前 成 椭圆 形 ， 并 转换 成 灰 度 
图 像 来 进行 标准 化 。 部 分 面孔 材料 选 自 中 国 化 面孔 
情绪 图 片 系统 ( 王 妍 ， 罗 跃 嘉 ，2005) 中 的 女性 -中 性 
情绪 库 。 中 国 化 面孔 情绪 图 片 系统 中 选取 的 图 片 与 
互联 网 材料 共同 组 成 原始 材料 .所 有 材料 都 经 过 20 
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名 中 国 大 学 生 在 吸引 力 水 平和 情绪 效 价 ( 均 为 101 
点 量 表 评 分 ) 上 的 评分 (10 名 女性 ,平均 年 龄 为 
20.543, 标准 差 2.17 岁 )， 其 中 被 评价 为 非 中 性 (与 
评分 50 有 显著 差异 ) 的 材料 被 剔除 。 选 定 的 材料 效 
价 评分 (M = 49.94, SD = 0.77) 与 中 性 (评分 50) 没 有 
显著 差异 , t(19) = 0.35, p = 0.732。 评 定 后 选择 的 原 
台面 孔 30 张 ， 其 中 包含 6 张 互联 网 材料 (其 中 4 张 
属于 高 吸引 力 组 , 2 张 低 吸引 力 组 )， 其余 24 张 图 片 
从 中 国 化 面孔 情绪 图 片 库 中 选取 。 

根据 吸引 力 评分 将 原始 材料 分 为 吸引 力 高 中 
低 3 组, 每 组 10 张 图 片 。 高 、 中 、 低 吸引 力 组 的 平 
均 分 分 别 为 76.33; 43.12; 22.42, 重复 测量 方差 分 析 
检验 3 组 评分 之 间 的 差异 发 现 差异 显著 , F(2, 38) = 
148.64, p < 0.001, np = 0.89。 两 两 比较 差异 显著 ， 
低 吸 引力 组 与 中 吸引 力 组 : t19) = 7.91, p < 0.001, 
Cohen’s d = 3.63; 中 吸引 力 与 高 吸引 力 组 : t(19) = 
9.77, p < 0.001, Cohen’s d = 4.48; 低 吸 引力 组 与 高 
吸引 力 组 : t(19) = 15.92, p < 0.001, Cohen’s d = 
7.30。 随 后 我 们 设置 来 自 不 同 吸引 力 分 组 的 面孔 组 
成 的 集合 ， 每 个 集合 中 的 图 片 数 量 包含 11 张 , 12 张 
两 种 情况 ,实验 1 共 60 个 集合 ,在 单个 集合 中 不 同 
吸引 力 分 组 的 图 片 被 使 用 的 次 数 不 同 ,而 每 个 实验 
所 用 的 所 有 集合 中 , 不 同 吸 引力 分 组 的 图 片 总 共 被 
使 用 的 次 数 是 相同 的 。 

随后 ， 用 面孔 合成 软件 Abrosoft FantaMorph 
(www.fantamorph.com) 将 不 同 面孔 集合 的 平均 面孔 
制作 出 来 , 共有 365 张 。 该 软件 可 以 将 两 张 面孔 按 
照 一 定 的 比例 融合 , 将 面部 各 特征 以 众多 关键 点 来 
标注 ， 如 嘴角 的 位 置 , 大 小 ， 弧度， 随后 取 关 键 点 
的 平均 值 来 合成 图 像 。 例 如 ， 当 我 们 希望 制作 4 张 
原始 面孔 的 平均 面孔 ,就 将 原始 面孔 两 两 一 组 ,再 
按照 50:50 的 比例 进行 合成 取 中 , 将 合成 的 两 张 图 
片 再 次 按照 50:50 比例 合成 ,就 相当 于 每 张 原始 面 
孔 在 合成 面孔 的 贡献 比例 为 25%, 得 到 了 4 张 原始 
平均 面孔 的 平均 面孔 。 如 果 要 制作 3 张 原始 面孔 的 平 
均 面 孔 ， 则 控制 每 张 面孔 的 贡献 比例 为 33.3% 即 可 。 

所 有 的 面孔 图 片 再 次 经 过 20 名 中 国人 民 大 学 
在 校生 的 吸引 力 评定 (10 名 女性 , 平均 年 龄 为 20.35 
岁 , 标准 差 2.03 岁 )， 作 为 事先 评定 的 得 分 。 

所 有 实验 材料 使 用 24 英寸 的 Dell 显示 屏 呈 现 ， 
分 辩 率 为 1920x1080, 灰色 背景 ， 被 试 直 坐 时 双眼 
距离 显示 屏 距 离 约 为 70 cm. 

2.1.3 ”实验 设计 
采用 单 因素 被 试 内 设计 ， 自 变量 为 


i 
n> 
A% 
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(无 平均 面孔 的 集合 G1 vs. 有 平均 面孔 的 集合 G2), 
因 变 量 为 判断 平均 面孔 吸引 力 更 高 的 比例 和 扩散 
模型 分 析 得 到 的 反应 决策 指标 (信息 累积 速率 v, 
限 差 值 a 和 非 决策 加 工时 长 t0, 详 见 结果 部 分 )。 
2.1.4 ”实验 程序 

实验 采用 平均 辨别 任务 ， 先 呈现 集合 刺激 ， 再 
呈现 探测 刺激 。 探 测 刺激 为 集合 平均 面孔 、 集 合成 
员 面 孔 、 非 成 员 非 平均 面孔 。 由 于 和 平均 面孔 以 及 
集合 平均 值 的 大 小 关系 不 确定 ,难以 对 结果 进行 推 
Dt, 后 两 种 刺激 类 型 在 本 研究 中 只 作为 反应 填充 刺 
激 ( 控 制 条 件 )。 

在 集合 刺激 类 型 上 , 使 用 12 张 原始 面孔 组 成 
集合 ， 即 是 “不 包含 平均 面孔 的 集合 G1” 水平 ,如果 
使 用 11 张 原始 面孔 组 成 集合 ,并 将 集合 成 员 的 平 
均 面孔 作为 新 成 员 进 入 集合 中 ， 即 是 “包含 平均 面 
孔 的 集合 G2” 水 平 。 包 含 平均 面孔 的 集合 中 , 平均 
面孔 的 位 置 随机 呈现 。 在 探测 刺激 类 型 上 ,呈现 集 
合成 员 的 平均 面孔 即 是 “集合 平均 面孔 "水 平 ， 当 集 


合 刺 激 包含 平均 面孔 时 ， 相 当 于 平均 面孔 出 现 两 次 ; 


“呈现 集合 成 员 之 一 ”的 水 平 中 ,呈现 集合 中 除了 平 
均 面 孔 以 外 的 其 他 成 员 面 孔 之 一 ; 呈现 集合 刺激 中 
没有 出 现 过 的 面孔 即 是 “新 面孔 ”水 平 。 

在 每 个 试 次 中 , 被 试 首先 注视 中 心 点 1000 ms, 
随后 ， 他 们 看 到 呈现 在 屏幕 上 的 集合 刺激 2000 ms, 
之 后 呈现 空 屏 500 ms， 随 后 呈现 一 张 探 测 面孔 ， 呈 
现 到 出 现 反 应 为 止 。 要 求 被 试 按 F 或 J 键 判断 集合 
刺激 的 整体 吸引 力 和 探测 刺激 的 个 体 吸引 力 哪 个 
更 高 , JE 180 个 试 次 , 各 个 条 件 混合 随机 呈现 , 每 
60 个 试 次 休息 一 次 ,在 探测 面孔 为 新 面孔 和 集合 成 
员 之 一 两 种 条 件 下 , 一 半 探 测 刺 激 在 预 评 中 的 吸引 
力 高 于 集合 刺激 成 员 吸引 力 平均 值 , 一 半 低 于 平均 
值 (如 图 1)。 
集合 刺激 以 4x3 EER, 单 张 面孔 图 片 的 视角 
为 5.69°x6.53°。 探测 刺激 材料 是 一 张 单独 的 面孔 , E 
现在 屏幕 中 央 , 图 片 尺寸 与 集合 成 员 刺 激 尺 寸 一 致 。 
2.1.5 ”扩散 模型 

根据 逆 层 级 理论 ,平均 面孔 的 形成 尽管 快速 ， 
但 仍然 需要 信息 累积 ， 因 而 有 可 能 在 包含 和 不 包含 
平均 面孔 的 集合 之 间 产 生 决 策反 应 差异 。 为 了 考察 
这 种 可 能 的 差异 ,我 们 分 析 了 反应 决策 信息 , 采用 
扩散 模型 (the diffusion model; Ratcliff, 1978; Ratcliff 
& McKoon, 2008) 将 不 同 的 认 知 过 程 进行 分 解 ， 综 
合 利用 反应 时 分 布 与 反应 准确 性 结果 ,进一步 分 析 
包含 和 不 包含 平均 面孔 对 集合 面孔 吸引 力 的 知觉 
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图 1 实验 1、 


机 制 。 该 模型 可 以 将 分 解 的 认 知 过 程 对 应 到 不 同 的 
模型 参数 中 (Voss et al., 2013). 

扩散 模型 的 基本 假设 是 : 在 快速 的 二 选 一 任务 
中 , 信息 从 起 始点 不 断 累 积 直到 达到 某 反 应 的 闵 限 
标准 后 激活 反应 。 基本 扩散 模型 (Ratcliff, 1978) 有 4 
个 参数 (如 图 2), 分 别 为 : 

1) 漂 移 率 (drift rate)， 记 为 v, 表明 信息 累积 的 


2) 国 限 差 值 [threshold separation), wX a, 表明 
做 决策 所 需要 的 信息 量 ; 

3) 起 始点 (starting point)， 记 为 z, 表明 决策 前 
的 预先 偏向 ; 

4) 非 决策 加 工时 长 (duration of nondecisional 
processes), WEN t0, 包含 编码 、 反 应 执行 等 非 决 策 
的 时 间 。 


个 正确 反应 反应 时 分 布 ”正确 反应 
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Z 错误 反应 反应 时 分 布 
图 2 扩散 模型 (翻译 自 Ratcliff & McKoon, 2008, Figure 
2)。 图 中 展示 了 扩散 模型 的 3 条 路 径 样 例 。 信 息 从 起 始 
点 (Z) 以 平均 速率 (开始 逐渐 累积 ， 直 到 达到 反应 A YY 
限 (a) 或 反应 B 的 冰 限 (0)。 由 于 随机 噪音 ， 这 些 路 径 在 每 
个 试 次 之 间 都 有 所 变异 。 


2.2 ”结果 
2.2.1 ”按键 反应 结果 
我 们 根据 预 评 吸 引力 分 数 计算 了 在 探测 刺激 


探测 刺激 持续 至 反应 
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2 流程 图 


类 型 为 控制 条 件 刺激 的 反应 正确 率 ， 以 此 确定 被 试 
进行 了 充分 理解 和 正确 反应 ， 同 时 验证 事先 评定 的 
吸引 力 评 分 是 否 适用 于 本 实验 的 被 试 。 根 据 预 评分 
数 计 算 集 合成 员 的 吸引 力 平 均值 ,再 和 预 评 的 探测 
面孔 吸引 力 比 较 来 确定 正确 反应 ， 结 果 表 明 探 测 刺 
激 类 型 为 新 面孔 和 集合 成 员 之 一 两 种 条 件 下 的 总 
正确 率 达 到 84.72%， 远 高 于 随机 反应 , t33) = 28.21, 
p < 0.001, 95% CI = [0.32, 0.37], Cohen’s d = 9.82. 
说 明 被 试 的 吸引 力 判 断 和 事先 评定 基本 一 致 。 根据 
事先 评定 的 得 分 , 我 们 分 别 统 计 了 实验 1 中 不 含 平 
均 面 孔 的 集合 中 探测 刺激 为 平均 面孔 的 条 件 下 所 
有 集合 成 员 吸 引力 的 平均 值 M1 = 49.19, 同时 假设 
该 集合 合成 了 平均 面孔 并 计算 包含 了 该 平均 面孔 
的 集合 成 员 吸 引力 平均 值 ， 也 就 是 假设 生成 了 平均 
面孔 并 将 其 吸引 力 计 算 进 集合 的 成 员 平 均值 M2 = 
50.49, M1 和 M2 的 差异 表明 , 合成 平均 面孔 提高 
了 集合 吸引 力 平 均值 , t(19) = 22.82, p < 0.001, 95% 
CI = [1.14, 1.37], Cohen’s d = 10.47。 

我 们 统计 了 实际 反应 中 判断 探测 刺激 平均 面 
孔 吸 引力 更 高 的 比例 。 无 论 集 合 中 包含 和 不 包含 平 
HEFL, 被 试 判断 平均 面孔 吸引 力 更 高 的 比例 (不 
包含 平均 面孔 G1: 84.03%, 包含 平均 面孔 G2: 
83.55%) 都 显著 高 于 随机 概率 (50%), t(33) = 8.16, p < 
0.001, 95% CI = [0.25, 0.42], Cohen’s d = 2.84; t(33) = 
10.31, p < 0.001, 95% CI = [0.27, 0.40], Cohen’s d = 
3.59。 当 探测 刺激 为 平均 面孔 ,判断 平均 面孔 吸引 
力 更 高 的 比例 在 包含 平均 面孔 、 不 包含 平均 面孔 的 
集合 类 型 之 间 没 有 显著 差异 (如 图 3), t33) = 0.11, p = 
0.912, 95% CI = [-0.10, 0.11], 表明 有 无 平均 面孔 
对 集合 吸引 力 的 知觉 辨别 没有 显著 影响 。 


chinaXiv:202303.08727v1 


ChinaXiv 合 作 期 刊 


第 7 期 田 欣 然 等 : 基于 合成 平均 刺激 的 平均 表征 机 制 一 一 来 自 平均 面孔 吸引 力 的 证 据 719 
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cero 条 件 所 需 的 t0 更 短 , t(33) = 2.57, p = 0.015, 95% CI = 
g aL [0.01, 0.06], Cohen’s d = 0.90. 
an OMT 2.3 讨论 
Re 020 实验 1 的 结果 表明 ,容量 为 12 的 集合 面孔 吸引 
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实验 一 实验 二 
图 3 不 同 条 件 下 被 试 判 断 平均 面孔 吸引 力 更 高 的 比例 


注 : G1 为 不 包含 平均 面孔 的 集合 、G2 为 包含 平均 面孔 的 集合 。 


2.2.2 ”扩散 模型 分 析 

前 述 比例 分 析 虽 然 表 明 有 无 平均 面孔 对 集合 
吸引 力 的 知觉 辨别 没有 显著 影响 , 但 并 不 清楚 对 辩 
别 决策 过 程 (如 辨别 时 间 、 决 策 标准 等 ) 有 无 影响 。 
这 里 我 们 采用 层级 扩散 模型 方法 (the hierarchical 
diffusion model, HDM; Vandekerckhove et al., 2011) 
进行 数据 的 模型 拟 合 。HDM 分 析 的 优势 在 于 在 模 
型 参数 计算 时 考虑 被 试 之 间 的 个 体 差异 。 此 外 模型 
上 下 限 分 别 设 定 为 正确 反应 和 错误 反应 , 在 探测 刺 
激 为 平均 面孔 条 件 时 , 将 判断 探测 刺激 吸引 力 更 高 
设 定 为 正确 反应 。 由 于 对 于 正确 和 错误 反应 不 存在 
预先 的 反应 偏向 ,因此 模型 将 起 始点 (z) 设 置 为 a/2。 
模型 的 其 他 参数 设 定 为 随 研究 变量 (集合 类 型 ， 探 
测 刺 激 类 型 ) 变 化 。 通过 层级 扩散 模型 拟 合 ,最 终 得 
到 每 个 被 试 在 每 个 条 件 下 的 漂移 率 v, BBR ZEA a 
和 非 决策 加 工时 长 t0, 并 进行 统计 检验 分 析 ( 如 图 4) 
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图 4 实验 1、 实 验 2 获得 的 层级 扩散 模型 拟 合 结果 
注 : G1 为 不 包含 平均 面孔 的 集合 、G2 为 包含 平均 面孔 的 集合 


扩散 模型 是 对 每 个 被 试 进行 单独 拟 合 ,一 般 认 
为 ， 如 果 模 型 拟 合 优 度 参数 Rhat 小 于 1.05 (Vehtari 
et al，2019)， 则 拟 合 度 较 优 , 我 们 对 实验 1 的 拟 合 
结果 进行 单 样本 上 检验 发 现 , 各 拟 合 参数 (M = 1.00) 
均 显 著 小 于 1.05， 表 明 模型 拟 合 良好 。 

以 模型 参数 为 因 变 量 的 t 检验 表明 , 在 信息 累 
积 漂移 率 v 和 净 限 差 值 a 上 , 集合 是 否 包含 平均 面 
孔 没 有 显著 差异 , t(33) = 0.48, p = 0.632; t(33) = 
1.72, p = 0.096。 这 表明 其 不 影响 对 集合 吸引 力 和 平 
均 面 孔 的 辨别 ; 但 非 决 策 加 工时 长 t0 受到 了 集合 


力 确实 存在 高 评 现象 。 这 种 高 评 现象 来 自 合 成 平均 
面孔 的 更 高 吸引 力 ,， 并 影响 了 被 试 对 集合 吸引 力 和 
探测 刺激 平均 面孔 的 比较 , 使 得 与 实际 包含 平均 面 
孔 的 集合 条 件 结果 没有 差异 。 实验 结果 模式 符合 假 
设 2 的 合成 平均 刺激 ,不 支持 假设 1 的 平均 值 计算 。 
因此 , 平均 辨别 并 不 是 简单 地 通过 计算 集合 原 有 成 
员 的 平均 值 ， 而 是 形成 了 集合 平均 面孔 。 由 于 平均 
面孔 的 高 吸引 力 ， 有 平均 面孔 集合 所 有 成 员 的 平均 
值 高 于 无 平均 面孔 的 集合 的 成 员 平 均值 ， 更 接近 探 
测 刺激 平均 面孔 ， 从 而 探测 刺激 和 集合 吸引 力 更 不 
易 区 分 。 因 而 ,如果 是 根据 平均 值 计算 来 完成 平均 
辨别 任务 ( 即 成 员 平 均值 是 比较 标准 )， 故 而 有 平均 
面孔 条 件 下 判断 平均 面孔 吸引 力 更 高 的 比例 将 低 
于 无 平均 面孔 条 件 。 但 是 , 结果 与 此 预测 相反 , 判 
断 平 均 面 孔 吸 引力 更 高 的 比例 在 包含 平均 面孔 、 不 
包含 平均 面孔 的 集合 类 型 之 间 没 有 显著 差异 .因此 ， 
更 可 能 的 是 人们 在 知觉 集合 刺激 时 将 成 员 合成 为 
一 张 新 面 孔 ( 即 具有 高 吸引 力 的 平均 面孔 )， 从 而 对 
不 包含 平均 面孔 的 集合 吸引 力 造 成 显著 的 提高 ; 而 
在 包含 平均 面孔 的 条 件 中 ， 整 个 集合 形成 的 平均 面 
孔 应 该 等 同 于 其 中 的 11 张 原始 面孔 形成 的 平均 面 
FL, 也 就 是 集合 中 已 经 出 现 的 这 张 平均 面孔。 那么 
平均 面孔 出 现在 集合 中 就 不 应 当 对 集合 吸引 力 造 
成 显著 的 提高 ; 故 包 含 /不 包含 平均 面孔 的 条 件 中 
选择 集合 整体 吸引 力 更 高 的 比例 不 存在 差异 。 

扩散 模型 分 析 结 果 表 明 , 在 没有 实际 平均 面孔 
的 输入 时 ， 编 码 加 工 等 非 决 策 时 间 更 长 ， 这 说 明和 平 
均 辨 别 任务 过 程 中 形成 平均 面孔 需要 加 工时 间 和 
资源 的 投入 。 这 个 过 程 是 很 快 的 ( 约 400 ms)， 因 而 
对 决策 影响 不 大 ， 从 而 决策 信息 累积 速度 与 有 实际 
平均 面孔 输入 时 没有 显著 差异 。 

总 结 而 言 , 实验 1 的 结果 表明 集合 吸引 力 的 判 
断 过 程 形成 了 平均 面孔 ， 从 而 导致 集合 吸引 力 高 
评 。 那 么 有 什么 因素 会 影响 平均 面孔 的 形成 呢 ? 
近期 研究 发 现 ， 高 级 特征 如 面孔 表情 的 平均 表征 是 
个 容量 有 限 的 过 程 (Ji et al, 2018), 受到 加 工资 源 
的 制约 (Li et al., 2016). 那么 ， 面 筷 吸 引力 的 平均 表 
征 是 否 也 受到 容量 的 影响 ?从 以 往 的 结果 看 ,答案 
似乎 是 肯定 的 。 例如, van Osch (2015) 发 现 , 在 集合 
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容量 为 4~6 的 集合 中 ,集合 吸引 力 高 评 现象 出 现 的 
可 能 性 很 低 。 以 往 发 现 面孔 集合 吸引 力 相 当 于 成 员 
平均 值 的 研究 也 都 采用 的 是 较 小 的 集合 (Anderson， 
1965; Anderson et al., 1973)。 这 是 否 说 明 小 容量 集 
合 中 没有 平均 面孔 形成 ,小 集合 面孔 吸引 力 判 断 存 
在 与 大 容量 集合 不 同 的 机 制 ? 但 还 存在 另外 一 种 
可 能 ， 即 平均 面孔 确实 形成 了 但 受到 干扰 。 为 了 分 
离 这 两 种 可 能 ,实验 2 考察 了 小 容量 集合 吸引 力 与 
平均 面孔 的 关系 。 


3 实验 2: 集合 容量 对 面孔 集合 加 
工 的 影响 
实验 2 采用 4 张 面孔 组 成 的 集合 , 采用 与 实验 


1 相同 的 实验 设计 和 程序 ,考察 了 容量 对 集合 吸引 
力 与 平均 面孔 的 关系 的 影响 。 


3.1 方法 
3.1.1 mit 


采用 GPower 以 统计 功效 power = 0.8， 中 等 效 
应 量 f= 0.25 和 重复 测量 2( 自 变量 集合 类 型 :无 平均 
面孔 的 集合 G1 vs. 有 平均 面孔 的 集合 G2) 为 参数 
估计 的 最 小 样本 量 为 N= 34。 实 际 招募 中 国人 民 大 
学 在 校生 35 名 大 学 生 ， 排 除 一 名 记 错 按键 方向 的 
被 试 ， 有 效 被 试 34 名 (17 名 女性 ), 平均 年 龄 20.68 
岁 , 标准 差 2.27 2, HAF, 视力 或 矫正 视力 正常 。 
3.1.2 ”实验 材料 

与 实验 1 相同 , 但 集合 刺激 只 包含 4 张 图 片 。 
在 集合 刺激 类 型 上 , 使 用 4 张 原始 面孔 组 成 集合 ， 
即 是 “不 包含 平均 面孔 的 集合 G1” 水 平 ， 如 果 使 用 3 
张 原始 面孔 组 成 集合 ,， 并 将 集合 成 员 的 平均 面孔 作 
为 新 成 员 进 入 集合 中 ， 即 是 “包含 平均 面孔 的 集合 
G2” 水 平 。 探 测 刺激 类 型 包括 集合 平均 面孔 、 集 合 
成 员 面 筷 、 非 成 员 非 平均 面孔, 探测 刺激 的 后 两 种 
刺激 类 型 是 控制 条 件 刺 激 。 

集合 刺激 以 2x2 FER, 图 片 的 尺寸 为 
8.19° x 9.43°。 探 测 刺激 材料 是 一 张 单独 的 面孔 , E 
现在 屏幕 中 央 , 图 片 尺寸 与 集合 刺激 尺寸 一 致 。 
3.1.3 ”实验 设计 

和 实验 1 相同 。 每 个 被 试 在 主任 务 完成 后 还 对 
每 张 图 片 进 行 了 吸引 力 评分 。 
3.1.4 ”实验 程序 

与 实验 1 相同 。 
3.2 ”结果 
3.2.1 ”按键 反应 结果 

根据 事先 评定 的 得 分 , 在 探测 刺激 类 型 为 新 面 


孔 和 集合 成 员 两 种 条 件 下 的 反应 正确 率 为 84.17%， 
显著 高 于 随机 水 平 , t(33) = 16.84, p < 0.001, 95% CI = 
[0.31, 0.39], Cohen’s d = 5.83， 以 此 确定 被 试 确实 
充分 理解 和 正确 反应 。 与 实验 1 相似 ， 分 别 统计 了 
探测 刺激 为 平均 面孔 的 条 件 下 不 含 平均 面孔 的 集 
合 中 所 有 成 员 吸 引力 的 平均 值 M1 = 47.82, 同时 也 
假设 该 集合 生成 了 平均 面孔 并 计算 包含 了 该 平均 
面孔 的 成 员 均 值 M2 = 49.73, M1 和 M2 的 差异 表 
AA, 平均 面孔 也 同样 提高 了 小 容量 集合 吸引 力 平均 
值 , t(29) = 6.68, p < 0.001, 95% CI = [1.44, 2.47], 
Cohen’s d = 2.48。 根 据 被 试 主任 务 后 的 评定 ， 发 现 
平均 面孔 的 吸引 力 (M = 55.18, SD = 11.02) 高 于 集 
合成 员 面孔 吸引 力 的 平均 值 (M = 51.71, SD = 11.76), 
t(33) = 2.35, p = 0.020, 95% CI = [0.51, 7.05], Cohen’s 
d= 0.820. 

对 实验 2 和 实验 1 中 平均 面孔 为 探测 刺激 条 件 
下 的 平均 面孔 吸引 力 进行 比较 , 结果 表明 小 集合 面 
孔 形成 的 平均 面孔 吸引 力 更 低 , 57.20 vs. 65.61， 校 
IE t(41.7) =100.61, p < 0.001, 95% CI = [8.26, 8.60], 
Cohen’s d = 24.53。 对 实验 2 和 实验 1 中 平均 面孔 ( 探 
测 刺激 ) 和 和 集合 平均 值 的 差 值 (9.51 vs. 16.43) 进 行 跨 
实验 比较 ,发现 实验 2 小 集合 平均 面孔 和 集合 平均 
值 的 差异 更 小 , 校正 t(53.8) = 112.13, p < 0.001, 
95% CI = [6.70, 6.94], Cohen’s d = 27.53。 因 而 , 小 
集合 中 判断 探测 刺激 平均 面孔 吸引 力 更 高 的 比例 
将 下 降 。 结 果 确 实 如 此 , 实验 2 中 判断 平均 面孔 吸 
引力 更 高 的 比例 显著 低 于 实验 1 (66.57% vs. 83.79%), 
校正 t(63) = 3.37, p = 0.001, 95% CI = [0.07, 0.27], 
Cohen’s d = 0.85. 

统计 检验 结果 表明 ， 被 试 倾向 于 认为 平均 面孔 
的 吸引 力 要 高 于 集合 的 吸引 力 。 判断 探测 刺激 平均 
面孔 吸引 力 更 高 的 比例 显著 高 于 随机 概率 ,t(33) = 
4.60, p < 0.001, 95% CI = [0.09, 0.24], Cohen’s d = 
1.60。 而 且 对 于 判断 平均 面孔 吸引 力 更 高 的 比例 ， 
集合 中 不 包含 平均 面孔 的 条 件 显 著 高 于 包含 平均 
面孔 的 条 件 , t(33) = 3.77, p = 0.001, 95% CI = [0.03, 
0.12], Cohen’s d = 1.31 (如 图 3)。 

由 此 可 见 ， 小 集合 的 加 工 结 果 确 实 与 大 集合 不 
同 , 为 了 探究 这 种 差异 的 存在 是 由 于 加 工 机 制 不 同 
还 是 平均 面孔 受到 干扰 ,我 们 对 不 含 平均 面孔 的 集 
合 中 是 否 形成 了 平均 面孔 进行 了 检验 。 我 们 通过 匹 
配 选 择 出 与 平均 面孔 吸引 力 接 近 的 新 面孔 探测 刺 
激 ， 两 类 面孔 的 吸引 力 均 值 分 别 为 54.80 vs 54.11, 
t(46) = 0.18, p = 0.859, 但 探测 刺激 为 平均 面孔 时 
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探测 刺激 吸引 力 被 判断 为 更 高 的 比例 (69.12%) 仍 然 
高 于 新 面孔 条 件 (52.01%), t(33) = 4.84, p < 0.001, 
95% CI = [10.21%, 24.88%], Cohen’s d= 1.69。 即 使 


Cohen’s d = 1.66 (如 图 4)。 
层级 扩散 模型 的 统计 结果 在 实验 间 存 在 差异 
(如 图 4)。 在 非 决策 加 工时 长 t0 E, 集合 包含 平均 


进一步 匹配 选择 出 比 平均 面孔 吸引 力 更 高 的 新 面 
孔 刺 激 (72.33 vs. 60.86, t(42) = 3.85, p < 0.001, 95% 
CI = [5.54%, 17.49%], Cohen’s d = 1.19), 探测 刺激 
为 平均 面孔 时 探测 刺激 吸引 力 被 判断 为 更 高 的 比 
例 (71.01%) 仍 然 高 于 新 面孔 条 件 (61.31%)，t(33) = 
2.62, p = 0.013, 95% CI = [2.24%, 17.13%], Cohen’s 
d = 0.91。 这 说 明 在 辨别 过 程 中 平均 面孔 并 不 是 作 
为 新 面孔 出 现 的 ， 而 更 可 能 是 集合 呈现 时 形成 了 平 
均 面孔 。 

我 们 还 计算 了 以 实际 集合 成 员 平 均值 M1 和 假 
设 形成 了 平均 面孔 后 的 集合 成 员 平 均值 M2 作为 比 
较 标 准时 的 正确 率 Accl 和 Acc2。 由 于 平均 面孔 评 
分 和 集合 平均 值 的 差 值 较 大 (平均 差异 10.40)， 容 
易 出 现 天 花 板 效应 ,我们 只 选择 了 差 值 低 于 10 的 
试 次 计算 Accl 和 Acc2。 如 果 形 成 了 平均 面孔 , AB 
么 集合 吸引 力 提高 ， 和 探测 刺激 的 平均 面孔 的 差 
异 减 小 ， 因 而 正确 率 将 降低 , Acc2 低 于 实际 平均 值 
的 正确 率 Accl， 从 而 接近 实际 包含 平均 面孔 的 集 
A Acc0。t 检验 结果 表明 , Acc2 (50.34%) 和 Accl 
(53.03%), t(33) = 1.18, p = 0.249, Cohen’s d = 0.42, 
Acc2 和 Acc0 (45.79%), t(33) = 1.46, p = 0.154, 
Cohen’s d = 0.51， 都 没有 显著 差异 。 以 3 个 正确 率 
为 自 变量 的 3 个 水 平 进 行 单 因 素 趋 势 分 析 (trend 
analysis)， 结 果 表 明 从 Accl 到 Acc2 再 到 Acc0 存 
在 线性 递减 趋势 , F(1, 33) = 4.21, p = 0.048, n = 
0.11。 这 些 结果 表明 ,尽管 不 含 平均 面孔 的 小 集合 
检测 到 的 平均 面孔 效应 无 法 完全 与 包含 平均 面孔 
的 条 件 相 等 ,但 合成 平均 面孔 依然 在 一 定 程度 上 
起 作用 。 
3.2.2 ”扩散 模型 分 析 

实验 2 同样 通过 层级 扩散 模型 拟 合 ， 最 终 得 到 
每 个 被 试 在 每 个 条 件 下 的 漂移 率 v, WIRE a 和 
非 决 策 加 工时 长 t0, 并 进行 统计 检验 分 析 。 各 拟 合 
参数 (M = 1.00) 均 显著 小 于 1.05， 表 明 模 型 拟 合 良好 。 

以 模型 参数 为 因 变 量 的 t 检验 表明 ,在 阐 限 差 
值 a 和 非 决策 加 工时 长 t0 E, 集合 是 否 包含 平均 面 
孔 对 集合 吸引 力 和 平均 面孔 的 辨别 没有 影响 , t32) = 
-0.63, p = 0.533, t(32) = 0.72, p = 0.095; 但 信息 累 
积 漂移 率 v 受 到 了 集合 是 否 包含 平均 面孔 条 件 的 影 
H, 集合 不 包含 平均 面孔 条 件 的 信息 累积 更 慢 ， 
t(33) = -4.775, p < 0.001, 95% CI = [-0.63, —0.25], 


面孔 与 否 和 集合 容量 存在 交互 作用 ，F(1，63) = 
14.03, p < 0.001, m= 0.18。 简 单 效 应 分 析 发 现 ,在 
集合 包含 平均 面孔 条 件 下 , 实验 1 的 t0 显 著 小 于 实 
Ky 2 的 10, (63) = -2.568, p = 0.013, 95% CI = [-0.09, 
-0.01], Cohen’s d = 0.65。 在 漂移 率 v E, 同样 存在 
集合 包含 平均 面孔 与 否 和 集合 容量 的 交互 作用 ， 
F(1, 63) = 9.63, p = 0.003, n= 0.13， 简 单 效应 分 析 
EM, 无 论 集合 包含 或 不 包含 平均 面孔 , 实验 1 的 
v 显著 大 于 实验 2 的 w t(63) = 5.51, p < 0.001, 95% 
CI = [0.94, 2.00], Cohen’s d = 1.39; t(63) = 3.16, p = 
0.002, 95% CI = [0.30, 1.34], Cohen’s d = 0.80. 
3.3 Wit 

实验 2 发 现 , 在 不 包含 平均 面孔 的 条 件 中 ,， 判 
断 平 均 面 孔 吸 引力 更 高 的 比例 显著 高 于 包含 平均 
面孔 的 条 件 , 说 明 平 均 面 孔 出 现在 集合 中 ,显著 地 
增加 了 集合 的 整体 吸引 力 。 由 此 可 见 ， 当 集合 容量 
为 4, 被 试 主观 形成 的 平均 面孔 表征 被 抑制 或 者 没 
有 形成 。 如 果 是 平均 面孔 表征 没有 形成 ， 则 平均 面 
孔 作 为 探测 刺激 应 该 和 新 面孔 类 似 , 但 分 析 表 明 平 
均 面 孔 和 新 面孔 的 探测 结果 完全 不 同 。 因 而 ,小 集 
合 面 孔 也 形成 了 平均 面孔 。 这些 结果 模式 符合 合成 
平均 刺激 的 假设 2, 不 支持 平均 值 计算 的 假设 1。 

尽管 小 集合 面孔 形成 了 平均 面孔 , 但 平均 辨别 
的 反应 模式 和 实验 1 大 集合 并 不 相同 。 这 可 能 是 因 
为 小 集合 中 形成 的 平均 面孔 更 容易 受 干 扰 ， 因 而 包 
含 平 均 面 孔 刺激 的 集合 吸引 力 更 接近 平均 面孔 从 
而 判断 平均 面孔 吸引 力 更 高 的 比例 降低 。 这 也 反映 
在 被 试 的 反应 决策 参数 上 ,决策 所 需 的 信息 累积 速 
度 相 对 实验 1 更 慢 ， 所 和 需 的 加 工时 间 更 长 。 扩 散 模 
型 的 结果 表明 ,在 有 实际 平均 面孔 的 输入 时 ,辨别 
决策 将 更 容易 ， 表 现 为 决策 信息 累积 更 快 。 这 些 结 
果 说 明 平 均 辩 别 任务 过 程 中 形成 了 平均 面孔 ， 只 是 
受到 了 干扰 。 这 种 干扰 还 体现 在 小 集合 判断 平均 面 
孔 吸 引力 更 高 的 比例 比 实验 1 更 低 。 实 验 结果 表明 ， 
这 可 能 来 自 两 个 原因 : 一 是 小 集合 平均 面孔 受 干扰 
(假设 3), 那么 集合 吸引 力 和 平均 面孔 的 差异 在 不 
包含 平均 面孔 刺激 的 集合 条 件 下 更 大 ， 从 而 小 集合 
判断 平均 面孔 吸引 力 更 高 的 比例 在 不 包含 平均 面 
孔 刺 激 的 集合 条 件 下 更 高 ; 二 是 小 集合 平均 面孔 吸 
引力 更 低 , 集合 和 平均 面孔 的 差异 更 小 (假设 4)。 

实验 1 和 实验 2 的 结果 来 自 于 相对 间接 的 平均 
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辨别 任务 。 为 了 提供 更 直接 的 证 据 ， 实验 3 和 实验 
4 采用 评分 任务 对 实验 1 和 实验 2 的 结果 进行 进 一 
步 验 证 。 


4 实验 3: 大 容量 面孔 集合 的 评分 
实验 3 采用 大 容量 面孔 集合 进行 评分 任务 。 为 


不 同 容量 下 集合 吸引 力 和 平均 吸引 力 的 关系 提供 
更 直观 的 证 据 。 


4.1 方法 
4.1.1 Wit 


采用 GPower 以 统计 功效 power = 0.8， 中 等 效 
应 量 f= 0.25 和 单 因 素 5 水 平 (评分 类 型 : 不 包含 平 
均 面孔 的 集合 的 成 员 均 值 M1、 不 包含 物理 平均 面 
孔 集 合 但 将 平均 面孔 计算 在 内 的 成 员 均 值 M2、 不 
包含 平均 面孔 的 集合 G1 包含 平均 面孔 的 集合 G2, 
平均 面孔 Avg) 为 参数 估计 的 最 小 样本 量 为 N= 21。 
实际 招募 中 国人 民 大 学 在 校生 29 名 大 学 生 ， 有 效 
被 试 29 名 (15 名 女性 ), 平均 年 龄 22.14 岁 ， 标准 差 
3.17 3, HAF, 视力 或 矫正 视力 正常 。 

4.1.2 ”实验 材料 

实验 刺激 与 实验 1 相同 。 

集合 刺激 包含 12 张 面孔 , 集合 刺激 以 4x3 4E 
阵 呈 现 ， 单 张 面孔 图 片 的 视角 为 5.69° x 6.53°。 

在 评分 类 型 上 , 使 用 12 张 原始 面孔 组 成 集合 ， 
即 是 “不 包含 平均 面孔 集合 "水 平 ; 如 果 使 用 11 张 
原始 面孔 组 成 集合 ,并 将 集合 成 员 的 平均 面孔 作为 
新 成 员 进 入 集合 中 ， 即 是 “包含 平均 面孔 集合 ”水 平 ， 
将 集合 成 员 面 孔 和 平均 面孔 再 次 进行 单独 评定 ， 即 
为 “单独 评定 ”水 平 。 

4.1.3 ”实验 设计 

采用 单 因 素 5 水 平 (评分 类 型 : 不 包含 平均 面 
孔 的 集合 的 成 员 均 值 M1、 不 包含 物理 平均 面孔 集 
合 但 将 平均 面孔 计算 在 内 的 成 员 均 值 M2 、 不 包含 


图 5 实验 3、4 流程 图 


面孔 的 评分 来 计算 集合 的 吸引 力 平 均值 ， 计 算 不 包 
含 平均 面孔 集合 条 件 下 的 集合 成 员 评 分 均值 ， 得 到 
M1 = 47.31; 再 假设 该 集合 生成 了 平均 面孔 从 而 计 
算 包 含 了 平均 面孔 的 成 员 均 值 ， 得 到 M2 = 48.78。 
将 M1、M2、 不 包含 平均 面孔 条 件 的 集合 吸引 力 
G1、 包 含 平均 面孔 条 件 的 集合 吸引 力 G2 和 平均 面 
孔 吸 引力 Avg 作为 评分 类 型 5 个 水 平 进行 方差 分 析 。 
结果 表明 , 评分 类 型 主 效应 显著 , F (4, 112) = 27.60, 
p < 0.001, n= 0.50。 多 重 比 较 结果 如 下 (如 图 6): 


国 Ml 图 G2 
QM2 G Avg 
G1 


面孔 或 面孔 集合 获得 的 
吸引 力 评分 


实验 4 
图 6 实验 3、4 吸 引力 评分 结果 ( 注 : M 为 不 包含 平均 
面孔 的 集合 的 成 员 均 值 、M2 为 不 包含 物理 平均 面孔 集合 


但 将 平均 面孔 计算 在 内 的 成 员 均 值 、G1 为 不 包含 平均 面 
孔 的 集合 、G2 为 包含 平均 面孔 的 集合 、Avg 为 平均 面孔 ) 


首先 ，M2 显著 大 于 M1, p< 0.001, 95% CI = 
[1.22，1.71]， 再 次 确认 了 合成 平均 面孔 对 集合 吸引 


平均 面孔 的 集合 G1、 包 含 平 均 面 孔 的 集合 G2. F 
均 面孔 Avg) 的 被 试 内 设计 。 因 变量 为 被 试 对 目标 集 
合 或 目标 面孔 的 吸引 力 评分 。 
4.1.4 ”实验 程序 

实验 流程 如 图 5 所 示 。 首 先 呈 现 500 ms 注视 
点 ， 而 后 在 屏幕 上 呈现 一 组 面孔 或 是 一 张 单独 面孔 ， 
被 试 要 对 目标 的 吸引 力 进 行 0~100 的 评分 , 0 代表 
吸引 力 最 低 , 100 代表 吸引 力 最 高 。 
4.2 ”结果 
1 于 单 张 面孔 的 评分 任务 中 包含 原始 面孔 也 
包含 各 个 集合 的 平均 面孔 ， 因 此 我 们 随后 使 用 单 张 


力 平均 值 的 提升 作用 。 其 次 , 不 包含 平均 面孔 的 集 
合 吸 引力 评分 G1 与 包含 平均 的 集合 G2 差异 不 显 
著 , p = 0.532; 与 M2 差异 不 显著 , p = 0.053; 但 大 
于 M1, p = 0.011, 95% CI = [1.26, 8.80]。 第 三 ,平均 
面孔 吸引 力 显 著 高 于 整个 集合 的 吸引 力 G1 、G2 和 
成 员 平 均值 M1, M2, ps <= 0.001。 趋 势 分 析 表 明 ， 
从 集合 成 员 平 均值 、 集 合 吸引 力 到 平均 面孔 , 存在 
着 逐渐 增加 的 趋势 , F (1, 28) = 62.82, p < 0.001, 
np = 0.69. 

除 此 以 外 , 我 们 也 尝试 了 分 析 平 均 面 孔 和 集合 
吸引 力 的 差 值 ， 发 现在 包含 或 不 包含 平均 面孔 的 集 
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合 间 差 值 没有 显著 差异 , t(28)= 0.19, p = 0.852, 再 
次 验证 了 实验 1 中 被 试 选择 探测 刺激 平均 面孔 吸引 
力 更 高 的 比例 在 集合 包含 和 不 包含 平均 面孔 条 件 
下 没有 显著 差异 。 
4.3 讨论 

实验 3 的 评分 任务 结果 基本 重复 了 实验 1 的 结 
果 。 首 先 , 在 大 容量 集合 中 的 评分 任务 验证 了 大 容 
量 集合 的 集合 吸引 力 高 评 现象 ， 即 集合 吸引 力 高 于 
集合 成 员 评 分 的 平均 值 。 其 次 , 平均 面孔 吸引 力 大 
于 集合 吸引 力 , 说 明了 实验 1 中 被 试 判断 探测 面孔 
吸引 力 更 高 的 原因 。 B=, 集合 是 否 包含 平均 面孔 ， 
对 于 集合 评分 没有 显著 影响 (支持 假设 2, 不 支持 假 
设 1); 并 且 , 不 包含 平均 刺激 的 集合 评分 Gl 只 有 
在 考虑 了 生成 平均 面孔 条 件 下 才 接 近 集 合成 员 平 
均值 ， 即 M2。 最 后 ,趋势 分 析 和 多 重 比较 结果 表明 ， 
不 包含 平均 刺激 的 集合 评分 更 接近 于 包含 平均 面 
孔 条 件 的 结果 。 这 些 结果 说 明 大 容量 集合 确实 生成 
了 平均 面孔 。 


5 实验 4: 小 容量 面孔 集合 的 评分 


实验 4 采用 小 容量 面孔 集合 进行 评分 任务 ， 为 
不 同 容 量 下 集合 吸引 力 和 平均 吸引 力 的 关系 提供 
更 直观 的 证 据 。 
5.1 方法 
5.1.1 ”被 试 

采用 GPower 以 统计 功效 power = 0.8， 中 等 效 
应 量 f= 0.25 和 单 因素 5 水 平 (评分 类 型 : 不 包含 平 
均 面孔 的 集合 的 成 员 均 值 M1、 不 包含 物理 平均 面 
孔 集 合 但 将 平均 面孔 计算 在 内 的 成 员 均 值 M2、 不 
包含 平均 面孔 的 集合 G1 包含 平均 面孔 的 集合 G2、 
平均 面孔 Avg) 为 参数 估计 的 最 小 样本 量 为 N= 21。 
实际 招募 中 国人 民 大 学 在 校生 31 AKFÆ, IR 
一 名 评分 全 距 小 于 10 的 被 坛 ， 有效 被 试 30 名 (15 
名 女性 ), 平均 年 龄 21.39 岁 , 标准 差 2.46 岁 ， 右 利 
F, 视力 或 矫正 视力 正常 。 
5.1.2 ”实验 材料 

实验 刺激 与 实验 1 实验 2 相同 。 

集合 刺激 包含 4 张 图 片 , 集合 刺激 以 2x2 $6 
呈现 。 当 评价 类 型 为 集合 平均 面孔 ,刺激 呈现 在 
幕 中 央 ,， 单 张 面 孔 图 片 的 视角 为 5.69° x 6.53°。 

在 评分 类 型 上 , 使 用 4 张 原始 面孔 组 成 集合 ， 
即 是 “不 包含 平均 面孔 集合 ?水平 ; 如 果 使 用 3 张 原 
台面 孔 组 成 集合 ， 并 将 集合 成 员 的 平均 面孔 作为 新 
成 员 进 入 集合 中 ， 即 是 “包含 平均 面孔 集合 ”水 平 ， 


握手 


将 集合 成 员 面 孔 和 平均 面孔 再 次 进行 单独 评定 ， 即 
为 “单独 评定 ”水 平 。 
5.13 ”实验 设计 与 程序 
与 实验 3 相同 。 
结果 
与 实验 3 类 似 , 使 用 单 张 面孔 的 评分 来 计算 集 
合 的 吸引 力 平 均值 ， 计 算 不 包含 平均 面孔 集合 条 件 
下 的 集合 成 员 评 分 均值 ， 得 到 M1 = 47.87; 再 假设 
该 集合 生成 了 平均 面孔 从 而 计算 包含 了 平均 面孔 
的 成 员 均 值 ， 得 到 M2 = 50.32。 将 M1、M2、 不 包 
含 平 均 面 孔 条 件 的 集合 吸引 力 G1、 包 含 平均 面孔 
条 件 的 集合 吸引 力 G2 和 平均 面孔 吸引 力 Avg 作为 
评分 类 型 5 个 水 平 进行 方差 分 析 。 结 果 表 明 ( 如 图 
6), 评分 类 型 主 效应 显著 , F (4, 116) = 6.27, p < 
0.001, np = 0.18。 多 重 比较 结果 如 下 : 

首先 , M2 显著 大 于 M1, p< 0.001, 95% CI = 
[1.82，3.08]， 再 次 确认 了 合成 平均 面孔 对 集合 吸引 
力 平均 值 的 提升 作用 。 其 次 , 不 包含 平均 面孔 的 集 
合 吸 引力 评分 G1 与 包含 平均 的 集合 G2 差异 不 显 
著 , p = 0.110; 与 M2 差异 不 显著 , p=0.977, 与 M1 
的 差异 也 不 显著 , p = 0.504。 第 三 , 平均 面孔 吸引 力 
显著 高 于 整个 集合 的 吸引 力 G1、G2 和 成 员 平 均值 
M1, M2, ps < 0.007。 此 外 ,趋势 分 析 表 明 ， 从 集合 
成 员 平均 值 、 集 合 吸引 力 到 平均 面孔 ,存在 着 逐渐 
增加 的 趋势 , F (1, 29) = 21.05, p < 0.001, n; = 0.42。 

除 此 以 外 ,集合 平均 面孔 和 集合 整体 吸引 力 的 
差 值 ， 不 包含 平均 面孔 集合 条 件 大 于 包含 平均 面孔 
集合 的 条 件 (9.90 vs. 3.64), t(29) = 6.40, p < 0.001, 
95% CI = [4.26, 8.26], Cohen’s d = 2.38， 可 以 更 直 
观 地 印证 实验 2 的 包含 平均 面孔 条 件 下 中 “被 试 判 
断 探测 刺激 吸引 力 更 高 的 比例 降低 了 ”这 一 结果 。 

对 实验 4 和 实验 3 中 的 平均 面孔 吸引 力 进 行 比 
Be, 结果 表明 小 集合 面孔 形成 的 平均 面孔 吸引 力 更 
低 ，60.11 vs. 65.24, p = 0.004, 95% CI = [2.76, 
13.85], Cohen's d= 0.94。 对 实验 4 和 实验 3 中 平均 
面孔 和 集合 平均 值 的 差 值 (6.76 vs. 12.55) 进 行 跨 实 
验 比 较 , 发 现存 在 一 种 可 能 的 趋势 ， 即 实验 4 的 小 
集合 中 平均 面孔 和 集合 成 员 平 均值 的 差异 更 小 , 校 
IE t(35.649) = 1.72, p = 0.094, 95% CI = [-1.06, 
12.81], Cohen's d = 0.07. 
5.3 讨论 

实验 4 的 评分 任务 结果 为 实验 2 的 结果 提供 了 
直接 的 支持 。 首 先 , 在 小 容量 集合 中 ,集合 吸引 力 
高 评 现象 减弱 了 , 集合 吸引 力 和 集合 成 员 评分 平均 
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值 M1, M2 都 没有 显著 差异 ,结合 实验 3 结果 ,验证 
了 前 人 结论 :集合 吸引 力 高 评 现象 在 大 容量 集合 强 ， 
在 小 容量 集合 弱 。 这 符合 平均 面孔 在 小 集合 中 更 易 
受 干扰 的 假设 。 此 外 , 小 容量 集合 的 平均 面孔 吸引 
力 确实 下 降 ， 和 集合 平均 值 的 差异 更 小 ， 因 而 小 集 
合 平均 面孔 吸引 力 相 对 大 集合 而 言 较 低 也 是 高 评 
现象 减少 的 一 个 可 能 原因 。 

其 次 , 实验 4 中 ,类 似 于 实验 3 的 结果 , 集合 
是 否 包含 平均 面孔 对 于 集合 评分 没有 显著 影响 ( 文 
持 假 设 2, 不 支持 假设 1); 并 且 不 包含 平均 刺激 的 
集合 评分 Gl 也 和 平均 面孔 计算 在 内 的 集合 成 员 平 
均值 M2 没有 差异 。 趋势 分 析 和 多 重 比较 结果 表明 ， 
不 包含 平均 刺激 的 集合 评分 更 接近 于 包含 平均 面 
孔 条 件 的 结果 。 这些 结果 说 明 小 容量 集合 也 可 能 受 
到 了 生成 的 平均 面孔 的 影响 。 此 外 ,集合 吸引 力 和 
平均 面孔 吸引 力 的 差异 在 不 包含 平均 面孔 刺激 的 
集合 条 件 下 更 大 (假设 3), 这 反映 了 包含 平均 面孔 
刺激 的 集合 吸引 力 更 接近 平均 面孔 吸引 力 , 更 直观 
地 说 明了 在 较 小 容量 的 集合 中 , 被 试 主观 形成 的 平 
均 面 孔 表 征 被 抑制 (结合 实验 2 R), 也 说 明了 为 
何在 实验 2 的 包含 平均 面孔 条 件 下 中 , 被 试 判断 控 
测 刺激 吸引 力 更 高 的 比例 降低 了 。 


6 综合 讨论 


实验 1、2 的 按键 反应 和 扩散 模型 拟 合 结果 和 
实验 3、4 的 评分 结果 共同 说 明 ， 当 集合 容量 为 12 
张 ， 高 吸引 力 的 平均 面孔 是 否 出 现 不 影响 集合 吸引 
力 评分 和 平均 辨别 任务 , 说 明 表 征集 合 时 形成 了 集 
合 平均 面孔 ; 当 集 合 容量 为 4 张 , 平均 面孔 效应 减 
弱 了 ,可 能 是 由 于 集合 平均 面孔 的 吸引 力 较 低 以 及 
平均 面孔 被 个 体 表 征 干 扰 了 。 

61 集合 面孔 吸引 力 高 评 现象 

在 van Osch 等 人 (2015) 的 研究 中 , 通过 采用 给 
若干 名 女性 拍摄 的 自然 材料 (如 聚会 照片 ) 评 分 来 探 
究 集合 吸引 力 ， 则 发 现 了 在 较 大 的 集合 (人 数 较 多 
的 照片 ) 中 存在 集合 吸引 力 高 于 集合 成 员 吸引 力 平 
均值 的 情况 。 

实验 1 的 平均 辨别 任务 发 现 ， 当 集合 不 包含 平 
均 面孔 时 , 判断 探测 刺激 吸引 力 更 高 的 比例 与 包含 


平均 面孔 时 相似 , 说 明 两 种 条 件 的 平均 吸引 力 相 近 ， 


不 包含 平均 面孔 的 集合 吸引 力 高 于 成 员 面 孔 的 平 
均值 ， 从 另 一 个 角度 反映 了 集合 吸引 力 高 评 现象 。 
实验 3 则 直接 再 次 验证 了 大 容量 集合 的 集合 吸引 力 
高 评 现象 。 


实验 4 的 评分 结果 说 明 集 合 吸 引力 高 评 现象 较 
弱 。 而 实验 2 正确 率 分 析 表 明 , 实验 2 也 出 现 了 集 
合 吸 引力 高 评 现 象 ， 只 是 实验 1 更 明显 ,类 似 地 , 在 
van Osch 等 人 (2015) 的 研究 中 ， 较 小 的 集合 也 很 少 
观察 到 集合 吸引 力 高 于 成 员 吸引 力 平均 值 。 在 本 研 
RP, 既 有 直接 通过 评分 获得 集合 面孔 吸引 力 高 评 
现象 的 直接 证 据 ， 也 有 借助 平均 面孔 在 集合 中 的 作 
用 大 小 来 推测 的 部 分 。van Osch 等 人 (2015) 研 究 中 
使 用 的 是 生态 效 度 较 高 的 自然 材料 ， 存 在 成 员 吸 引 
力 分 布 集中 , 缺少 具有 代表 性 的 高 低 吸引 力 面孔 的 
问题 。 本 研究 则 改 用 了 没有 背景 ， 由 单独 评分 的 面 
孔 素 材 组 成 的 集合 ， 并 平衡 不 同 吸 引力 水 平 的 面孔 
数量 , 依旧 得 到 了 类 似 的 结论 , 说 明 在 大 容量 集合 
中 集合 吸引 力 高 评 现象 是 比较 稳定 的 ， 且 现象 的 产 
生 与 集合 平均 面孔 的 形成 有 关 。 

6.2 ”平均 表征 的 形成 机 制 

通过 将 平均 辨别 的 实际 反应 与 不 同 理论 假设 
的 反应 分 布 进行 比较 和 拟 合 ,我 们 发现 集合 吸引 力 
包含 平均 面孔 贡献 的 假设 拟 合 更 好 ,支持 了 平均 表 
征 过 程 中 形成 了 平均 刺激 (如 平均 面孔 )。 在 实验 1 
H, 集合 包含 平均 面孔 时 ,判断 平均 面孔 吸引 力 更 
高 的 比例 并 未 降低 , 说 明 包 含 或 不 包含 平均 面孔 刺 
激 的 集合 吸引 力 同等 接近 平均 面孔 ， 因 此 平均 表征 
并 不 是 通过 集合 成 员 的 平均 值 计 算得 到 的 。 类 似 的 ， 
无 论 还 是 实验 3 还 是 实验 4, 都 发 现 平均 表征 的 吸 
引力 要 远 高 于 集合 成 员 的 平均 值 。 在 实验 2 的 小 集 
AP, 发 现 新 面孔 作为 探测 刺激 与 平均 面孔 作为 探 
测 刺 激 的 结果 不 同 ， 则 说 明 平 均 面孔 作为 探测 刺激 
出 现 之 前 已 经 得 到 了 加 工 。 这 个 结论 和 近期 Ying 
等 人 (2020) 的 结论 一 致 ， 他 们 通过 吸引 力 适 应 后 效 
范式 发 现 , 由 一 组 面孔 引发 的 适应 后 效 等 于 这 一 组 
的 平均 面孔 引发 的 适应 后 效 ， 同 样 支持 了 集合 表征 
中 存在 平均 刺激 的 形成 。 

值得 注意 的 是 , 平均 刺激 的 形成 也 需要 资源 投 
入 ,体现 在 实验 1 没有 平均 面孔 输入 时 需要 更 长 的 
编码 加 工时 间 。Huang (2015) 发 现 对 于 对 象 特 征 和 
统计 表征 ,启动 的 效果 是 相等 的 , 说 明 统 计 表征 的 
形成 至 少 需 要 和 单个 个 体 加 工 同 等 的 注意 资源 。 因 
此 , 平均 表征 和 个 体 表征 在 早期 可 能 是 因此 相互 竞 
争 的 关系 (Li et al, 2016)。 由 于 早期 没有 足够 的 认 知 
资源 加 工 所 有 个 体 ， 因 此 优先 形成 了 平均 表征 。 
Bauer (2017) 以 不 同 长 短 的 线条 作为 集合 刺激 ,在 
平均 辨别 任务 前 加 入 数字 记忆 任务 的 研究 发 现 ， 相 
比 低 记忆 负荷 条 件 (1 个 0), 高 记忆 负荷 条 件 下 (4~7 
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个 随机 数字 ) 更 有 利于 形成 平均 表征 。 实 验 1 和 实 
验 2 的 跨 实 验 比 较 也 发 现 , 在 小 集合 中 整体 信息 积 
累 速 度 也 比 大 集合 更 慢 。 

与 此 同时 ,小 集合 同样 形成 了 平均 表征 且 需 要 
资源 的 投入 ， 表 现在 实验 2 没有 平均 面孔 输入 时 信 
息 积累 较 慢 。 也 就 是 说 无 论 大 小 集合 ,都 有 平均 刺 
激 的 形成 。 而 大 小 集合 之 间 的 反应 差异 ,是 由 于 其 
他 原因 造成 的 ， 而 不 是 出 于 不 同 的 加 工 机 制 。 

63 ”集合 吸引 力 与 平均 面孔 的 关系 

尽管 集合 吸引 力 表 征 中 包含 了 平均 面孔 的 贡 
献 ， 但 集合 吸引 力 并 不 完全 等 同 于 平均 面孔 的 吸引 
力 。 无 论 实验 1 还 是 实验 2, 均 发 现 被 试 倾向 于 评 
价 平均 面孔 比 集合 吸引 力 更 高 的 结果 。 并 且 实 验 3、 
4 平均 面孔 的 评分 也 要 高 于 集合 的 评分 , 说 明 集 合 
吸引 力 是 基于 平均 面孔 的 形成 ,将 平均 刺激 纳入 进 
来 成 为 集合 的 成 员 ， 再 对 于 集合 进行 整体 评价 。 因 
此 , 集合 吸引 力 高 评 现象 并 不 完全 如 van Osch 等 人 
(2015) 所 推断 的 仅 依赖 于 平均 面孔 ,而 是 与 表情 集 
合 加 工 类 似 , 读 取 平均 面孔 的 表征 (Haberman & 
Whitney, 2009)。 

类 似 的 现象 是 , 被 试 经 常 在 再 认 任 务 中 把 平均 
表征 误 以 为 是 集合 中 的 成 员 , 或 者 认为 平均 面孔 与 
其 中 一 个 成 员 具 有 相同 的 身份 (Neumann et al., 
2013)。 判 断 过 程 中 被 试 可 能 使 用 了 一 种 策略 : 在 
加 工整 个 集合 吸引 力 的 时 候 , 将 平均 面孔 知觉 成 集 
合 中 某 一 成 员 ， 由 于 观察 到 集合 中 的 其 他 面孔 的 吸 
引力 多 数 低 于 平均 面孔 ,进而 倾向 于 认为 单独 出 现 
的 平均 面孔 的 吸引 力 较 高 。 

研究 者 曾 发 现 ， 当 存在 多 张 面孔 , 单 张 面孔 的 
吸引 力 会 被 判断 得 比 孤 立 出 现时 更 高 (Walker & 
Vul, 2014), 并 同样 解释 为 平均 的 作用 。 背景 面孔 导 
致 会 将 人 脸 的 感知 偏向 群体 的 平均 水 平 。 因 此 , 伴 
随同 一 目标 面孔 出 现 的 背景 面孔 吸引 力 越 高 ， 目 标 
面孔 就 会 被 评价 得 越 高 (Perrett et al., 1994; Walker 
& Vul, 2014)。 因 此 , 平均 面孔 产生 可 能 会 对 集合 中 
的 其 他 成 员 产 生 影 响 , 由 于 平均 面孔 的 吸引 力 高 ， 
导致 集合 其 他 成 员 的 吸引 力也 得 到 了 抬升 。 这 是 平 
均 面 孔 对 其 他 面孔 产生 的 影响 , 也 可 能 是 集合 吸引 
力 高 评 现象 产生 的 路 径 之 一 。 

6.4 ”平均 刺激 表征 与 集合 容量 的 关系 

小 容量 集合 中 面孔 吸引 力 一 般 会 被 评价 与 集 
合成 员 平 均值 相同 (Anderson, 1965; Anderson et al., 
1973)， 且 集合 吸引 力 高 评 现象 在 小 容量 集合 消失 
(van Osch et al., 2015), 说 明 小 容量 的 平均 表征 存 


在 一 些 特异 性 。 

一 方面 ,小 容量 集合 产生 的 平均 面孔 刺激 的 吸 
引力 相对 较 低 ， 可 能 因此 导致 对 于 集合 吸引 力 的 增 
加 效果 较 小 ， 因 此 集合 吸引 力 高 评 现象 减少 。 男 一 
方面 ， 可 能 是 平均 表征 受到 了 干扰 。 道 层级 理论 提 
出 (Hochstein et al., 2015), 高 级 皮层 的 整体 表征 以 
自 上 而 下 的 方式 返回 到 局 部 加 工 ， 以 局 部 细节 信息 
证 实 (或 矫正 ) 初 步 的 整体 表征 估计 值 ， 也 就 是 说 平 
均 表 征 在 加 工 后 期 会 受到 个 体 表征 的 矫正 。 Li 等 人 
(2016) 也 发 现 ， 当 呈现 时间 延 长 , 认 知 资源 增加 ， 
会 导致 个 体 表征 的 精度 增强 。 

这 两 种 理论 均 得 到 了 本 研究 结果 的 支持 ,在 实 
验 2 中 判断 平均 面孔 吸引 力 更 高 的 比例 更 低 ， 以 及 
实验 4 中 的 平均 面孔 和 集合 吸引 力 差 值 比较 结果 表 
明 小 集合 包含 平均 面孔 的 集合 吸引 力 和 平均 面孔 
的 差异 更 小 ， 都 说 明 小 集合 平均 面孔 吸引 力 较 低 在 
其 中 存在 影响 。 与 此 同时 , 实验 2 在 包含 平均 面孔 
刺激 时 平均 面孔 吸引 力 更 高 的 比例 更 低 , 说 明 相 对 
于 被 试 自己 生成 平均 面孔 刺激 ， 直 接 输入 平均 面孔 
减少 了 集合 吸引 力 和 平均 面孔 之 间 的 差异 ， 文 持 小 
集合 的 平均 面孔 受到 了 干扰 。 在 小 集合 中 无 论 集 合 
是 否 包含 平均 面孔 , 信息 积累 速度 都 比 大 集合 更 慢 ， 
支持 逆 层 级 理论 所 说 的 局 部 细节 信息 对 于 整体 
表征 的 矫正 和 干扰 。 


7 结论 


(面孔 集合 吸引 力 高 评 现象 是 基于 平均 面孔 
刺激 的 形成 。 

(2) 平 均 表 征 的 产生 是 基于 平均 刺激 的 产生 。 

(3) 无 论 在 大 小 集合 中 都 形成 了 平均 刺激 。 小 集 
合 中 集合 吸引 力 不 出 现 高 评 现象 是 由 于 平均 刺激 
受到 了 干扰 ， 并且 平均 刺激 本 身 吸引 力 较 低 。 

(4) 平 均 表 征 的 加 工 也 需要 一 定 认 知 资源 。 
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Abstract 

Previous research demonstrated that ensemble perception of groups can be formed rapidly by extraction of 
the average of high-level complex features. However, it is unclear whether the average percept is the outcome of 
extraction from the characteristic value of the average stimulus (for example, average face) created from group 
members, or from calculation of the average value of group members’ characteristic values. The above two 
values were confused with each other in prior research, since most average value of group members are similar 
as the characteristic value of the average stimulus. However, the attractiveness rating of the average face created 
from a group of faces is usually systematically higher than the mean value of attractiveness ratings of this group 
of faces. Therefore, it is easier to explore how the ensemble coding of crowd face attractiveness (i.e. group 
attractiveness) is formed by comparing the attractiveness of the average face with the mean value of 
attractiveness rating of a group of faces. This could provide a useful approach to explore how the average 
percept is formed. The present study used the average discrimination paradigm (Experiment | & 2) and the 
scoring paradigm (Experiment 3 & 4) to clarify the mechanism of the formation of average percept by 
comparing the group attractiveness with the attractiveness of average face. To tackle this issue, whether the 
average face was presented in the group of faces or not was manipulated (conditions: Avg vs. NoAvg). Group 
size were also manipulated to explore whether group size modulated the formation of average percept. 

In the average discrimination paradigm, a group of faces served as group stimuli to be compare with the 
probe face for attractiveness. Participants were asked to judge which is more attractive between the group 
stimuli and the probe face. In the scoring paradigm, participants were asked to rate the attractiveness of group 
stimuli, the average face created from the group, and each face of the group in isolated manner. Each group 
consisted of twelve (in Experiments 1 and 3) or four faces (in Experiments 2 and 4). There were two kinds of 
groups: one is that all group members are original faces, without the average face. The other is that an average 
face morphed from other original faces was included in the group. 

In Experiment 1, the proportions for judging probe average face more attractive than group attractiveness in 
the Avg condition was similar with the NoAvg condition. In Experiment 2, when the set size was four, the 
proportions for judging probe average face more attractive than group attractiveness were significantly higher in 
the NoAvg condition. Moreover, in Experiment 3, the ratings for group attractiveness were not significantly 
different between Avg and NoAvg conditions. This may indicate that the group attractiveness is based on the 
average face which was created from group members rather than the mean value calculated from group 
members’ attractiveness. In addition, the diffusion model analysis showed that the coding time was longer for 
NoAvg condition, which indicated that the formation of average face needed cognitive resource. In Experiment 4, 
when the set size was four, the attractiveness rating of the average face was significantly higher than group 
ratings for the two kinds of groups. The different results in different group size may be interpreted as the 
outcome of weakened average percept caused by the salient individual face representations in small group. This 
was evident from several analyses: 1) group attractiveness and the attractiveness of morphed average face 
decreased with smaller set size (Experiment 4); 2) When the probe face was morphed average face, the 
proportion for judging probe face as more attractive than group attractiveness was greater, comparing with the 
condition when the probe was a new face whose attractiveness was similar with the morphed average face 
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(Experiment 2); 3) The performance for the hypothesized condition with average percept included in the set is in 
between the conditions with/without real average face included (Experiment 2-4). In addition, comparing with 
Experiment 1, the information accumulation speed in Experiment 2 is slower, the processing time of group 
attractiveness is longer, reflecting the disturbance of the individual face representation. In summary, the findings 
supported the hypothesis that group attractiveness is based on the morphed average face. Thus, the ensemble 
percept relies on the extraction from the average stimulus created from the group. 

Key words average representation, face attractiveness, average face 


